رهیافتی ترکیبی برای انتخاب ویژگی در ابعاد بالا به کمک الگوریتم های فرا-ابتکاری

پایان نامه
چکیده

انتخاب ویژگی نقش مهمی در دنیای یادگیری ماشین و به خصوص مسائل طبقه بندی داده، بازی می کند. این فرآیند، مسأله کاهش بعد داده از طریق شناسایی زیرمجموعه ویژگی هایی است که بیشترین ضرورت را در طبقه بندی داده دارند. امروزه داده ها هم از نظر تعداد نمونه ها و هم از نظر تعداد ویژگی ها رشد قابل توجهی داشته اند. مسائل انتخاب ویژگی در داده های با بعد بالا، بسیار پیچیده تر از مسائل معمولی طبقه بندی الگو است. این داده ها شامل میزان زیادی اطلاعات نامرتبط و افزونه هستند که باعث گیج و سردرگم شدن الگوریتم یادگیری و در نتیجه کاهش عملکرد آن می-شوند. برای جلوگیری از این مسأله که به "نفرین بعد" نیز معروف است، انتخاب ویژگی بسیار حائز اهمیت است. در این پایان نامه، یک روش ترکیبی برای انتخاب ویژگی داده های با بعد بالا ارائه شده است. الگوریتم پیشنهادی، ابتدا با بکارگیری یک روش انتخاب ویژگی خردجمعی که ترکیبی از چند روش فیلتری است، بعد داده را کاهش می دهد. سپس، به کمک الگوریتم فرا-ابتکاری جستجوی گرانشی باینری بهبودیافته زیرمجموعه ای از ویژگی های برجسته انتخاب می شوند. همچنین، روش های مختلفی برای تجمیع ویژگی ها در انتخاب ویژگی خرد جمعی معرفی شده است. عملکرد روش های مختلف تجمیع ویژگی ها و طبقه بند های مختلف در روش پیشنهادی، روی 21 مجموعه داده میکروآرایه ای استاندارد بررسی شده است. نتایج حاصل از روش پیشنهادی نیز با چند روش انتخاب ویژگی داده های با بعد بالا مقایسه شده است. نتایج بدست آمده نشان دهنده کارایی لازم روش پیشنهادی در انتخاب ویژگی داده های با بعد بالا است.

منابع مشابه

راهکار ترکیبی برای انتخاب ویژگی در داده های ابعاد بالا

با پیشرفت روزافزون تکنولوژی در زمینه داده کاوی در حوزه های علمی مختلف، مجموعه داده های با ابعاد بسیار بالا در حال افزایش است که منجر به کاهش کارایی الگوریتمهای دسته بندی می شود. لذا نیاز به کاهش حجم این مجموعه داده ها امری ضروری است. در مجموعه داده ها با ابعادبالا، تعداد زیادی ویژگی برای هرنمونه وجود دارد که بسیاری از آنها نامرتبط و زاید می باشند. در این پایان نامه برروی انتخاب ویژگی بر روی مجم...

15 صفحه اول

انتخاب خوشه های اولیه به کمک الگوریتم های هوشمند برای مشارکت در خوشه بندی ترکیبی

به علت بدون ناظر بودن مسئله خوشه بندی انتخاب الگوریتمی خاص جهت خوشه بندی یک مجموعه ناشناس امری پر خطر و معمولا شکست خورده می باشد. به خاطر پیچیدگی مسئله و ضعف روش های خوشه بندی پایه، امروزه اکثر مطالعات به سمت روش های خوشه بندی ترکیبی هدایت شده است. پراکندگی در نتایج اولیه یکی از مهم ترین عواملی است که می تواند در کیفیت نتایج نهایی اثرگذار باشد. همچنین، کیفیت نتایج اولیه نیز عامل دیگری است که د...

متن کامل

طراحی یک الگوریتم فرا ابتکاری جهت انتخاب پورتفوی بهینه ردیابی‌کننده شاخص بورس تهران

تخصیص بهینه منابع مالی در بازار سرمایه یکی از اصلی‌ترین موضوعات در حوزه تصمیمات سرمایه‌گذاری است. اتخاذ تصمیمی اثربخش در این خصوص، نیازمند وجود زمینه‌های مناسب سرمایه‌گذاری و ابزار و تکنیکهای تحلیل مناسب در بازار سرمایه است. یکی از این تکنیکهای کارآمد که علاوه بر داشتن مزایای منحصر به فرد، پایه و اساس استراتژیهای نوین سرمایه‌گذاری قلمداد می شود، ردیابی شاخص[1] است. با توجه به اهمیت و نقش غیر قا...

متن کامل

طبقه‌بندی سیگنال‌های مغزی تصور حرکت دست چپ و راست در سامانه‌های واسط مغز و رایانه با استفاده از انتخاب ویژگی به کمک الگوریتم‌های فرا ‌ابتکاری

مقدمه: بازشناسی فعالیت‌های مختلف حسی- حرکتی در سامانه‌های واسط مغز و رایانه با مباحث بازشناسی الگو در ارتباط است. یکی از مسائل مهم در طراحی یک سامانه مؤثر واسط مغز و رایانه، چگونگی کاهش تعداد ویژگی‌های استخراج شده از سیگنال‌های مغزی است. استفاده از الگوریتم‌های انتخاب ویژگی یکی از مهم‌ترین مراحل در زمینه بازشناسی الگو می‌باشد. کاهش تعداد ویژگی‌ها می‌تواند در بهبود دقت و کارایی طبقه‌بند‌ها و در ...

متن کامل

استخراج و انتخاب ویژگی با استفاده از الگوریتم های فرا ابتکاری و موجک در بازار سهام

در بسیاری از تحقیقات مانند بازشناسی الگو، پیش بینی قیمت و ... انتخاب مجموعه ای از ویژگی های موثر اهمیت بسزایی دارد. اگر تعداد متغیرهای ورودی نامربوط زیاد باشند زمان اجرای کل فرآیند افزایش پیدا می کند و بر نتیجه نهایی اثر نامطلوب خواهد گذاشت. ازاین رو انتخاب و استخراج ویژگی معمولاً قدم اول در ساخت مدل های پیش بینی کننده قیمت است. استخراج ویژگی به منظور کشف خصیصه های جدید بر اساس داده های اولیه اس...

طبقه‌بندی سیگنال‌های مغزی تصور حرکت دست چپ و راست در سامانه‌های واسط مغز و رایانه با استفاده از انتخاب ویژگی به کمک الگوریتم‌های فرا ‌ابتکاری

مقدمه: بازشناسی فعالیت‌های مختلف حسی- حرکتی در سامانه‌های واسط مغز و رایانه با مباحث بازشناسی الگو در ارتباط است. یکی از مسائل مهم در طراحی یک سامانه مؤثر واسط مغز و رایانه، چگونگی کاهش تعداد ویژگی‌های استخراج شده از سیگنال‌های مغزی است. استفاده از الگوریتم‌های انتخاب ویژگی یکی از مهم‌ترین مراحل در زمینه بازشناسی الگو می‌باشد. کاهش تعداد ویژگی‌ها می‌تواند در بهبود دقت و کارایی طبقه‌بند‌ها و در ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023